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HE: [目的 /意义 ] 在 重大 突 发 公共 卫生 事件 绵延 期 间 ， 如 何 及 时 感知 、 有 效 量化 并 持续 跟踪 政府 的 防 控 政 
策 组 合 对 社会 公众 认 知 与 情绪 的 影响 ， 是 监测 预警 和 应 急 处 置 吸 待 解决 的 难题 。[ 方 法 /过 程 ] 以 情绪 即 社会 
信息 理论 为 依托 ， 提 出 融合 BERTopic 主题 模型 与 多 元 回归 (MLR)、 时 间断 点 回归 (CRDiT) 的 新 方法 ， 对 新 
浪 微 博 2020 年 31 万 余 条 新 冠 疫 情 高 频 用 户 评论 文本 实施 因果 推断 ， 以 揭示 新 冠 防疫 遏制 政策 组 合 对 公众 
的 影响 。[ 结果/ 结论 ] 研究 发 现 : (1) 新 冠 防疫 遏制 政策 组 合 的 实施 在 2020 年 2 月 20 日 前 后 ， 造 成 微 博 
用 户 公众 情绪 值 显著 下 降 0. 07-0. 12 个 单位 ， 在 2020 年 4 月 28 日 前 后 ， 也 带 来 微 博 用 户 公众 情绪 值 显著 
回升 0. 06-0. 08 个 单位 ; 〈2) 防疫 政策 组 合 对 微 博 用 户 的 认 知 与 情绪 影响 具有 异 质 性 ， 涉 及 个 体 、 具 强制 
性 的 政策 易 引 发 网 民 热 议 且 联动 公众 情绪 显著 下 滑 ; (3) 基于 分 析 构 建 的 政策 干预 = 用户 热 议 主题 用 户 
情感 异动 因果 链 ， 能 够 起 到 漳 因 推断 政策 实施 成 效 的 作用 。 研 究 不 仅 为 公共 卫生 政策 评价 的 循 数 智 治 开拓 
了 新 思路 ， 提 出 的 方法 也 为 公众 导向 的 防疫 实时 监测 增添 新 手段 。 
关键 词 : 疫情 过 制 政策 公众 情绪 ”多 元 回归 分 析 “时 间断 点 回归 
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提高 政策 决策 的 科学 化 、 民 主 化 是 健全 决策 机 制 、 提 高 政策 质量 、 优 化 政策 效果 的 必然 要 求 ， 也 是 新 

时 代 推 进 国 家 治理 能 力 现代 化 的 重要 举措 《中 华人 民 共 和 国 国 民 经 济 和 社会 发 展 第 十 四 个 五 年 规划 和 
= 2035 年 远景 目标 纲要 》 在 “全 面 推进 健康 中 国 建设 ”部 分 明确 指出 :“ 完 善 突 发 公共 卫生 事件 监测 预警 处 
T 置 机制 …… 提 高 应 对 突 发 公共 卫生 事件 能 力 ”。 作 为 近 百 年 来 全 球 范围 发 生 的 最 严重 的 传染 病 ， 新 型 冠状 
病毒 肺炎 感染 疫情 〈 后 简称 新 冠 疫情 ) 具有 传播 速度 快 、 感 染 范围 广 、 剖 击 影 响 深 及 防 控 难 度 大 等 特点 

"5 。 伴 随 疫情 的 爆发 、 流 行 与 持续 ， 世 界 各 国政 府 纷纷 采取 了 从 控 疫 情 到 保 发 展 等 不 同 程度 、 多 样 类 型 

的 干预 政策 组 合 ”"*。 其 中 ， 遏 制 和 封 控 是 一 类 最 常见 的 政策 工具 ， 包 括 居家 令 、 保 持 社 交 距 离 、 学 校 售 

课 、 公 共 场 所 减少 聚集 以 及 出 行 限制 等 。 尽 管 疫情 封 控 过 制 政策 有 效 降 低 了 新 冠 疫 情感 染 人 数 ， 但 随 着 疫 
情 的 持续 蔓延 ， 不 可 避免 地 对 公众 的 心理 与 生理 产生 越 来 越 大 的 冲击 。 如 何 创 新 监测 手段 ， 及 时 感知 、 有 
效 量化 并 持续 跟踪 不 同 防疫 政策 组 合 对 社会 大 众 认 知 与 情绪 的 影响 ， 既 是 大 数据 驱动 的 循 证 决策 研究 前 沿 ， 
也 是 各 级 政府 进一步 健全 疫情 多 渠道 监测 预警 ， 落 实 科 学 精准 防疫 的 焦点 。 在 这 方面 ， 牛 津 大 学 布 拉 瓦 尼 
克 政 府 学 院 研 究 人 员 开 发 了 “牛津 COVID-19 政府 响应 追踪 系统 ”， 构 建 了 标准 化 指标 体系 ， 从 封 控 遏制 、 
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经 济 纾 困 、 健 康 医疗 、 疫 苗 注 射 及 其 他 5 个 方面 采集 公开 数据 比较 各 国政 府 应 对 疫情 的 速度 和 力度 ””， 
可 用 于 追踪 不 同 国家 及 地 方 政府 政策 干预 力度 的 差异 。 也 有 学 者 从 数字 治理 视角 ， 通 过 分 析 中 国 网 络 问 政 
平台 “领导 留言 板 ” 汇 集 的 网 络 与 情 数据 ， 探 讨 网 民 留言 与 政府 回应 的 互动 逻辑 "以 及 问 政 平台 扮演 的 民 
情感 知 及 与 情 纾 解 角色 ”。 比 较 而 言 ， 从 社会 公众 视角 量化 跟踪 防疫 政策 实施 影响 的 研究 还 不 多 见 。 

本 文 基于 系统 观 ， 将 新 冠 防疫 遏制 政策 的 实施 视 作 政策 主体 作用 政策 客体 的 动态 循环 过 程 ， 依 托 情绪 
即 社会 信息 (Emotions as Social Information, FASI) 理论 ， 从 认 知 和 情绪 两 维度 剖析 新 冠 防疫 遏制 政 
策 实施 对 社会 大 众 心理 的 影响 。 具 体 而 言 ， 从 新 浪 微 博 采 集 31 万 余 条 与 新 冠 疫 情 相 关 的 高 频 用 户 评论 ， 
提出 融合 自然 语言 处 理 前 沿 技 术 一 BERTopic 主题 模型 与 多 元 回归 (MLR)、 时 间断 点 回归 CRDIT) 的 方法 ， 
探讨 社交 媒体 用 户 发 帖 映 射 的 公众 认 知 焦点 评论 的 语义 主题 分 布 ) 和 情绪 《评论 的 情感 极 性 变化 ) 如 何 
受 政策 影响 波动 ， 帮 助 政府 决策 者 量化 不 同类 型 防 控 政 策 对 人 们 心理 认 知 和 情绪 偏向 的 影响 。 研 究 的 潜在 
价值 体现 在 :〈1) 通过 技术 治理 手段 ， 将 偏 宏 观 的 防疫 遏制 政策 组 合 与 社会 公众 的 个 体感 受 有 机 联系 ， 为 
重大 公共 卫生 事件 应 对 政策 影响 评估 的 事 中 智能 化 和 精准 化 监测 拓展 新 思路 ; (2) 提出 的 分 析 框 架 与 量化 
方法 具有 直面 公众 ， 数 据 驱动 ， 漳 因 推 断 的 特点 ， 不 仅 有 助 于 拓展 数据 驱动 的 政策 循 证 决策 理论 创新 ， 
也 为 突 发 公共 卫生 事件 防 控 与 社会 治理 增添 准 实时 分 析 手 段 。 


1 相关 文献 与 理论 分 析 
1.1 新 冠 防疫 政策 与 网 络 问 政 

既 有 研究 指出 ， 焦 点 事件 〈focusing events) 是 对 特定 区 域 及 群体 造成 影响 且 被 公众 和 决策 者 关注 
的 事件 ， 它 的 发 生 一 般 会 对 某 一 群 人 的 利益 造成 现实 伤害 ， 对 其 他 人 的 利益 产生 潜在 危害 ””。 新 冠 疫情 
是 重大 突 发 公共 卫生 事件 ， 不 仅 具 有 起 始 突然 、 发 展 迅 速 、 影 响 广 泛 的 特点 ， 也 呈现 难以 预知 、 传 染 隐 秘 、 
结果 不 定 等 特征 ”。 从 林 德 布 洛 姆 的 渐进 决策 视角 考察 ， 政 府 出 台 的 疫情 遏制 政策 具有 两 大 显著 特点 : O 
决策 渐进 细 化 ， 疫 情 的 发 展 难为 人 力 全 控 ， 防 疫 部 署 需要 因 时 、 因 事 而 变 ， 包 决策 成 效 难 料 ， 每 个 防 控 对 
策 利 浆 兼 具 ， 在 时 间 紧 迫 、 信 息 有 限 的 不 确定 条 件 下 只 能 选择 一 定 程度 的 “满意 解 ”， 从 政策 演化 的 视角 ， 
借助 多 源流 理论 分 析 ， 新 冠 防疫 过 制 政策 的 出 台 与 执行 不 是 某 一 因素 单独 作用 的 结果 ， 而 是 特定 时 刻 问 题 
源流 、 政 策 源流 与 政治 源流 汇聚 共同 作用 的 产物 ， 其 中 问题 源流 对 疫情 政策 的 走向 影响 很 大 。 伴 随 移动 互 
联网 的 高 度 普 及 ， 用 户 在 社交 媒体 上 针对 疫情 的 留言 评论 ， 不 仅 是 广大 网 民 内 心 想法 的 实时 流露 ， 也 是 社 
会 公众 与 情 动 向 的 数字 化 “晴雨 表 ”。 当 前 ， 社 交 媒 体 已 成 为 政府 察 民情 、 集 民智 的 重要 渠道 ， 网 络 问 政 
也 开始 从 政策 出 台 前 的 意见 征询 逐渐 向 政策 实施 中 的 成 效 妃 踪 延 伸 。 通 过 社交 媒体 的 高 频 互动 特性 实时 采 
集 网 民 的 议政 心声 ， 洞 悉 公 众 对 政策 的 不 同 想法 ， 不 仅 有 助 于 决策 集思广益 ， 也 为 政策 执行 成 效 评价 提供 
多 维 、 量 化 证 据 。 
1. 2 情绪 即 社会 信息 理论 与 网 民 的 情绪 社会 效应 
早 在 古 希腊 时 期 ， 亚 里 士 多 德 就 主张 ， 情 绪 是 由 人 们 的 认 知 对 于 世界 中 的 事件 的 解释 和 评价 引起 。 情 
绪 的 社会 建构 论 主张 : 群体 是 “ 泛 化 的 他 人 ”， 参与 同一 过 程 的 众多 人 的 态度 ， 会 影响 到 个 体 自身 行为 方 
式 的 选择 "”。 移 动 互联 网 时 代 ， 社 交 媒体 既 是 个 人 认 知 外 部 世界 的 重要 渠道 ， 也 是 汇聚 个 体 认 知 ， 形 塑 社 
会 认同 的 载体 。 互 联网 用 户 评论 不 仅 表征 语义 信息 也 承载 情感 信息 ， 情 绪 所 有 具有 的 社会 效应 可 以 借用 情绪 
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即 社会 信息 理论 来 说 明 。 该 理论 根植 于 情绪 的 社会 功能 论 ， 由 Van Kleef (2009) 提出 ， 主 张 情绪 是 一 种 社 
会 信息 ， 认 为 个 体 在 表达 情绪 的 同时 ， 也 反映 其 认 知 、 态 度 等 信息 。 在 人 际 交 往 中 ， 其 他 观察 者 对 个 体 情 
绪 信 息 的 认 知 主要 通过 情感 反应 与 推断 加 工 两 种 途径 获取 ， 前 者 直接 激发 观察 者 的 情绪 状态 ， 产 生 情 绪 层 
面 的 “人 际 效 应 ”; 后 者 将 个 体 的 情绪 信息 作为 社会 决策 信息 输入 ， 产 生 认 知 层面 的 “人 际 效应 ””… ” 。 
此 外 ， 情 绪 的 社会 效应 还 受 个 体 信 息 加 工 深度 以 及 感知 合适 性 两 个 变量 的 调节 影响 ， 前 者 表征 观察 者 的 信 
息 处 理 能 力 ， 后 者 反映 特定 情境 下 观察 者 依据 社会 规范 判断 他 人 情感 表达 的 合适 性 。 石 密 等 (2017) ”对 
网 络 集体 行为 意向 营 延 的 情绪 感染 路 径 研 究 证 实 : 网 络 情境 中 , 情绪 感染 并 不 能 直接 作用 于 网 络 集体 行为 
意向 ， 而 是 通过 情绪 体验 的 无 意识 感染 路 径 与 信息 感知 的 有 意识 社会 比较 路 径 影 响 网 络 集体 行为 意向 的 表 
达 。 这 从 一 个 侧面 映 证 ， 网 络 社交 媒体 中 的 用 户 评论 行为 既 受 公众 发 帖 热 点 的 影响 ， 也 受热 帖 的 情绪 偏向 
影响 。 因 此 ， 通 过 社交 媒体 追踪 广大 网 民 对 政策 干预 引发 的 热点 主题 轮 动 ， 以 及 热点 评论 的 情感 变动 ， 能 
够 起 到 感知 政策 的 公众 社会 认同 以 及 情绪 认 知 的 作用 。 
1.3 基于 系统 观 的 分 析 框 架 

从 系统 观 视 角 审 视 ， 新 冠 防疫 政策 组 合 是 由 政策 主体 、 政 策 客体 以 及 政策 环境 等 相互 作用 构成 的 复杂 
社会 系统 ”。 该 系统 可 以 解构 为 输入 、 输 出 与 反馈 三 个 变量 间 的 动态 循环 来 分 析 : 输入 可 以 视 为 问题 源流 、 
政策 源流 和 政治 源流 的 汇 入 ， 输 出 为 政策 主体 发 布 的 政策 组 合 及 执行 措施 ， 反 馈 则 是 受 政策 干预 影响 的 政 
策 客体 与 政策 主体 间 的 循环 往复 。 新 冠 疫情 的 爆发 加 速 公众 沟通 渠道 从 线 下 转向 线 上 ， 基 于 社交 媒体 的 用 


户 评论 洞悉 网 民 对 防疫 政策 的 认 知 焦点 及 情绪 波动 ， 可 以 从 政治 源流 、 政 策 源流 和 问题 源流 三 方面 为 政策 
的 改进 与 优化 提供 准 实时 反馈 ， 也 为 政策 事前 评估 和 事 中 监测 拓展 思路 (如 图 1 示意 )。 
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图 1 系统 观 视角 的 防疫 政策 对 社交 媒体 用 户 影响 框架 


2 研究 设计 
2.1 数据 来 源 

为 探索 新 冠 防疫 遏制 政策 对 网 民 疫 情 认 知 与 情感 倾向 的 的 复杂 影响 ， 研 究 从 中 国 知名 社交 媒体 一 新 浪 
微 博 的 多 个 账号 采集 疫情 相关 的 用 户 评 论文 本 作为 主要 数据 集 。 选 择 新 浪 微 博 作 为 网 民用 户 评论 数据 源 主 
要 基于 两 点 考虑 : 首先 ， 新 浪 微 博 2020 年 用 户 发 展 报告 显示 ”， 截 至 2020 年 9 月 ， 微 博 月 活用 户 达 5. 11 
亿 ， 日 活用 户 2.24 亿 ， 其 中 90 后 和 00 后 占 比 接近 80%。2020 全 年 热门 话题 不 断 ， 引 发 年 轻 用 户 的 广泛 
关注 、 追 踪 与 讨论 ， 凸 显 其 强大 的 公共 与 情 属 性 ， 其 次 ，2020 年 微 博 认 证 的 政务 机 构 账 号 数量 超过 14 万 


个 ， 粉 丝 总 数 突破 30 亿 ， 疫 情 期 间 ， 微 博 用 户 日 均 查 看 疫情 信息 161 亿 次 ， 高 频 互 动能 准 实 时 反映 公众 
的 热点 认 知 和 情绪 波动 。 为 确保 评论 样本 来 源 多 样 且 具 代 表 性 ， 选 取 采 集 涵盖 政府 (共青团 中 央 、 中 央 电 
视 台 )、 新 闻 (“人民 日 报 、 武 汉 发 布 、 中 国 日 报 、 搜 狐 新 闻 、 观 察 者 网 、 环 球 时 报 、 人 民 网 、 涪 浒 新 闻 )、 
社区 (司马 南 、 张 文宏 医生 〉 12 个 知名 微 博 账号 2020 年 1 月 1 日 至 12 月 31 日 期 间 疫 情 相 关 微 博 用 户 评 
论 。 这 些微 博 账号 粉丝 用 户 在 185 万 到 1. 5 亿 之 间 ， 人 气 高 且 互 动 频 。 进 一 步 而 言 ， 设 定 仆 取 每 个 账号 疫 
情 相 关 微 博 最 多 250 条 热门 评论 作为 网 民 高 认可 度 的 代表 性 评论 ， 然 后 从 符合 要 求 的 12 个 微 博 账号 发 布 
的 微 博 中 随机 抽取 三 千 条 微 博 采 集 评论 文本 ， 获 得 28 个 字段 315213 条 记录 的 数据 集 。 对 原始 数据 清洗 ， 
剔除 文字 重复 、 内 容 过 短 的 评论 ， 剩 余 313912 条 数据 用 于 后 续 分 析 。 
2. 2 变量 选择 与 定义 

针对 获取 的 微 博 用 户 疫情 评论 数据 ， 首 先 ， 借 助 开源 的 百度 情感 分 析 工 具 分 析 每 条 评论 的 情感 倾向 ， 
计算 得 到 微 博 用 户 日 均 情绪 值 (Dailly Average Sentiment of Weibo Users, DASWU) 作为 研究 的 因 变 量 。 
其 次 ， 针 对 影响 公众 情绪 的 外 生 因素 ， 分 别 从 疫情 变化 、 防 疫 政 策 、 经 济 指标 等 多 维度 寻找 自 变 量 。 疫 情 
变化 方面 ， 选 取 每 日 新 增 感染 人 数 、 每 日 新 增 死亡 人 数 等 指标 表征 疫情 波动 特征 ， 防 疫 政策 方面 ， 以 牛津 
大 学 “牛津 COVID-19 政府 响应 追踪 系统 ” 开源 的 国家 层面 政策 应 对 数据 为 来 源 ， 从 封 控 遏制 、 经 济 纾 困 、 
健康 医疗 、 疫 苗 注射 和 其 他 5 个 一 级 政策 类 别 和 15 个 二 级 政策 工具 中 选取 校园 封 控 、 取 消 公众 聚会 、 限 
制 公共 交通 、 管 控 跨 境 人 员 流 动 、 疫 苗 接种 、 核 酸 检测 、 密 接 追 踪 和 佩戴 口 轩 等 8 项 政策 作为 表征 不 同 政 
策 组 合 的 干预 影响 。 选 择 理由 在 于 上 述 8 项 政策 大 多 都 出 现在 《《 新 型 冠状 病毒 肺炎 防 控 方 案 》 第 1 版 到 
第 6 版 中 ， 具 有 上 典型 性 和 代表 性 。 经 济 指标 方面 ， 选 取 GDP 增 速 、 居 民 消费 价格 指数 CCPL) 等 衡量 宏观 
经 济 变 动 影响 。 此 外 ， 为 考察 疫情 持续 对 公众 情绪 的 影响 ， 将 疫情 爆发 以 来 的 历时 (Days Elapsed, DE) 
作为 自 变量 ， 其 他 诸如 递 延 的 微 博 用 户 日 均 情 绪 值 (Delayed Dailly Average Sentiment of Weibo 
Users, DDASWU) 等 作为 控制 变量 ， 如 表 1 示意 : 
= 表 1 变量 定义 及 数据 来 源 


序号 变量 定义 数据 来 源 
T 1 HEHP LEE OAS 反映 微 博 用 户 当日 整体 情绪 水 平 的 数值 新 浪 微 博 
本 为 过 制 新 冠 疫情 的 传播 ， 我 国 各 中 小 学 牛津 covID_1g 

Robt es BEATE BEAT EBERT HEIL, ER ag we 

(CL School. closing) 内 师 生 非 必要 不 出 校 ， 出 校 需 向 学 校 报 
ce 系统 
备 审批 。 
aie Aes Ear ee Œ COVID-19 
‘ WARK PARA RRR LAT, ERER ENTE 
(C3 Cancel. public. events) 进行 线 下 的 聚集 性 活动 。 系统 i 
REJ HZD 针对 疫情 严重 的 城市 取消 或 减少 高 铁 、 ”牛津 COVID-19 
4 (C5 Close public transport) ”航班 等 交通 运输 工具 的 班次 ， 在 必要 时 ”政府 响应 追 只 
BE ? 停 开 公交 、 地 铁 等 市 内 公共 交通 。 系统 
ps bp be A ARZ ss a ha ESRAS 津 COVID-1 
BIEN RIZ 严格 限制 人 员 跨 境 流动 ， 对 入 境 人 员 实 “生津 COVID 19 
5 (C8_International, travel. contr 、、 a R TE ah 政府 响应 追踪 
施 严 格 的 隔离 管控 措施 。 
ols) 系统 
as ne ae er 津 COVID-19 
EIT LER 对 民众 实施 新 冠 疫苗 接种 ， 提 升 民众 抵 “TR COVID Is 
6 和 F E E bb 政府 响应 追踪 
(H7 Vaccination. policy) 抗 病毒 能 力 。 系统 
Klee dll 提高 核酸 检测 的 效率 ， 对 风险 人 员 按 期 ”牛津 COVID-19 


(H2 Testing. policy) 进行 核酸 检测 ， 做 到 “应 检 尽 检 ?”。 政府 响应 追踪 


8 BREE 

(H3 Contact. tracing) 
9 ie AE 

(H6_ Facial. Coverings) 
10 PYTBIEL- (new deaths) 
11 HHZ (positive rate) 
12 PIA (newcases) 
13 WA FRR 


(El Income. support) 


14 MIRKE (E3 Fiscal. measures) 


ig AU FF 
(E4 International. support) 

BEIT RAR EEA 

16 (H4 Emergency. investment. in. he 

althcare) 
7 民房 资金 六 入 
(H5_ Investment. in. vaccines) 

18 FEBEMIIKE (days) 

o AE LR AGOBIL HINES EE 
Æ (senti lag) 

20 Hite 2 RABI! ALS AE 
Æ (senti lag?) 

,| PPE 3 AGIMIBML* FISSURE 
Æ (senti lag3) 

g PPIE 4 RBNUIBIIP FISSURE 
Æ (senti lag4) 

yg MR RBCS" FLARE 
Æ (senti lag5) 

DREA EIA 
24 (CHI Public. information. campaig 
ns) 


对 与 确诊 患者 有 时 空 交 集 的 人 员 开 展 密 
接 溯源 追踪 ， 及 时 采取 管控 措施 。 


要 求 民众 进入 公共 场合 和 乘坐 公共 交通 
时 佩戴 口 单 。 


每 日 因 新 冠 肺炎 死亡 的 人 数 


每 日 现 有 新 冠 肺炎 病毒 阳性 人 数 占 总 人 
口 的 比例 


每 日 新 增 新 冠 肺炎 患者 人 数 


对 中 小 企业 /困难 群众 发 放 补贴 ， 纾 困 角 
难 的 措施 。 
政府 通过 指导 财政 分 配 活动 和 处 理 各 种 
财政 分 配 关 系 干 预 国家 宏观 经 济 ， 以 应 
对 新 冠 疫 情 对 国民 经 济 带 来 的 负面 影 
响 。 


FA 


民众 接种 的 新 冠 疫苗 费用 由 
算 。 


到 家 财政 结 


向 公众 普及 与 新 冠 肺 炎 相 关 的 知识 ， 宣 
fe WAF, MOR” SRN TIE AM 
措施 。 
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系统 
牛津 COVID-19 
政府 响应 追踪 
系统 
牛津 COVID-19 
政府 响应 追踪 

系统 
国家 卫 健 委 统 

计数 据 
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系统 
牛津 COVID-19 
政府 响应 追踪 


牛津 COVID-19 
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绪 也 可 能 因 筑波 


疫情 爆发 与 封 控 ， 表 现 为 疫情 以 武汉 为 


! 心 爆发 ， 全 国 支 援 武汉 ， 社 会 面 封 控 ， 疫 情 得 到 初步 遏制 ; 


=r. 


阶段 ，2 月 21 日 -4 月 280°, ZAS 
性 胜利 ， 复 工 复 产 有 序 展 开 ; 


AS BA 


第 三 阶段 ，4 


29 日 -12 月 31 
全 面 复工 复 产 ， 同 时 疫情 防 控 常 态 化 ， 诊 疗 重心 转向 核酸 检测 。 为 


1 日 


2 H 20 H 


资料 来 源 ， 新浪 微 博 、 牛 津 COVID-19 政府 响应 追踪 系统 、 国 家 卫 健 委 统计 数据 
考虑 到 疫情 从 爆发 到 延续 呈现 波段 前 行 特征 ， 政 府 的 干预 政策 因 时 而 变 ， 公 众 的 情 
按照 政府 出 台 的 防疫 政策 变化 ， 将 研究 时 期 分 为 三 个 阶段 展开 : 第 一 阶段 ，2022 年 1 月 


动 。 
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oy — 
il) SRL, FAAS ir a oR i, RARE AR FE 
日 ， 全 面 恢复 与 常态 化 防 控 ， 表 现 为 抗 疫 成 
究 公 众 情绪 与 政策 干预 
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及 其 他 变量 间 的 因果 关系 ， 后 续 分 析 均 以 天 为 时 间 计 量 单位 。 
2. 3 方法 与 模型 设计 

考虑 到 获取 的 数据 以 文本 数据 为 主 ， 兼 有 数值 型 数据 ， 提 出 融合 多 元 线性 回归 Multi Linear 
Regression, MLR), WHEW AE (Regression Discontinuity Design in time，RDiT) 和 BERTopic 主题 


模型 的 量化 研究 思路 如 图 2 示意 : 


Q 数据 获取 © 数据 处 理 分 析 方法 分 析 结 果 及 用 途 


识别 各 阶段 显著 影响 
> DASWU 的 外 生 因素 及 影 
响 大 小 (回归 系数 ) 


分 阶段 的 多 元 线性 回归 分 
析 (MLR) 


图 2 新 冠 疫情 遏制 政策 对 公众 情绪 影响 研究 框架 

本 文 研究 对 象 是 用 户 发 布 的 新 冠 疫情 相关 的 评论 文本 ， 期 望 综 合 自然 语言 处 理 领 域 前 沿 技术 及 因果 推 
断 新 方法 ， 定 量 分 析 中 国 中 央 政 府 出 台 的 疫情 遏制 与 控制 政策 对 社会 公众 心理 情绪 的 影响 。 为 达 此 研究 目 
标 ， 首 先 ， 编 写 python 代码 调用 百度 智能 云 AI 服务 一 一 NLP 模块 的 情感 倾向 分 析 API， 通 过 文本 情感 分 
析 技 术 量 化 用 户 评论 文本 的 情感 极 性 〈0- 负 向 ，1- 中 性 ，2- 正 向 ); 其 次 ， 将 计算 得 到 的 考虑 时 间 因 素 的 
微 博 用 户 日 均 情绪 值 (Daily Average Sentiment for Weibo Users, DASWU) 作为 因 变量 ， 新 冠 疫情 过 上 
政策 组 合 及 其 他 影响 因素 作为 自 变 量 或 控制 变量 ， 通 过 多 元 回归 分 析 (MLR) 探索 不 同 阶段 影响 用 户 情 绪 
变动 的 关键 因素 ; 第 三 ， 以 新 冠 防疫 过 制 政 策 的 阶段 切换 为 自然 实验 场景 ， 疫 情 持续 时 长 为 配置 变量 
(assignment variable)， 将 三 个 阶段 的 时 间 转 换 日 (分 别 为 2 月 20 日 和 4 月 28 日 ) 作为 断 点 ， 应 用 时 
间断 点 回归 分 析 (RDiT) 方法 ， 考 察 两 个 断 点 处 特定 疫情 遏制 政策 对 公众 情绪 波动 的 因果 影响 ， 最 后 ， 引 
入 基于 Transformer 的 双向 编码 表征 (BERT) 舱 入 的 主题 建 模 技术 一 BERTopic， 识 别 各 阶段 公众 关注 的 疫 
情 热 点 主题 及 其 变化 以 追溯 各 阶段 用 户 情绪 变化 主要 动因 。 下 面 重点 说 明 时 间断 点 回归 和 BERTopic 主题 
模型 作为 研究 方法 引入 的 必要 性 。 
2. 3. 1. 时 间断 点 回归 

与 传统 的 断 点 回归 设计 有 所 不 同 ， 时 间断 点 回归 将 时 间作 为 配置 变量 ， 通 过 判断 结果 变量 是 否 在 受到 
政策 干预 影响 的 时 间 点 发 生 跳跃 来 推断 干预 变量 与 结果 变量 之 间 的 因果 关系 。 该 方法 已 被 研究 者 用 于 探讨 
公共 交通 对 缓解 道路 拥挤 的 影响 ， 住 房 限 购 政 策 的 有 效 性 和 蜡 质 性 评价 ”， 新 冠 疫情 冲击 下 的 企业 生存 
万 性 分 析 ” 等 研究 情境 中 。 本 文 应 用 时 间断 点 回归 评价 特定 疫情 遏制 政策 是 否 显著 影响 公众 情绪 值 的 波动 ， 


= 


1 


出 于 两 点 考虑 : (1) 2020 年 国家 出 台 的 疫情 遏制 与 控制 政策 种 类 多 样 ， 各 项 政策 实施 时 间 不 一 ， 采 用 时 
间断 点 回归 能 有 效 规避 其 他 政策 因素 对 结果 的 干扰 ; (2) 时 间 变 量具 有 均匀 分 布 特点 ， 将 其 作为 配置 变量 
分 布 频率 不 会 发 生变 化 ， 断 点 附近 样本 量 相 对 较 少 。 为 此 ， 首 先 用 式 (2) 评估 断 点 日 期 前 后 微 博 用 户 情 绪 
值 变 化 : 

T Rp = mY : d =0+e = a : d =0+e ] (1) 


€ 


u 


HD PY , 代表 微 博 用 户 日 均 情 绪 值 ASW), d 是 断 点 日 期 前 后 的 天 数 ， 随 后 构建 时 间断 点 
归 基 准 模型 如 式 (2) 所 示 : 
Y , =B o+tB 1*D , +h(t )+6 *X , +e , (2) 


式 (2) 中 YY , 是 因 变 量 一 微 博 用 户 日 均 情绪 值 CDASWU), D , 是 时 间 点 上 的 情绪 断 点 值 ， 
X , 是 其 他 控制 变量 ，h(t ”) 是 其 他 在 观测 窗口 与 因 变 量 时 序 相关 的 未 观测 时 变 因 素 变 量 ( 以 多 项 
式 呈 现 ， 可 以 看 到 在 断 点 处 连续 且 平 滑 )， 也 即 是 说 ， 时 间断 点 前 的 观测 值 未 受 特定 政策 影响 ， 时 间断 点 
后 的 观测 值 受 特定 政策 干预 影响 ， 属 于 清晰 断 点 。 参 考 高 软 等 (2022) 的 建议 ， 分 别 采用 全 局 变量 和 局 
部 变量 估算 法 对 影响 时 间 点 t 情绪 变化 的 系数 B ”1 进行 估算 。 本 文采 集 的 用 户 评论 为 高 频数 据 ， 计 算得 
到 的 微 博 用 户 日 均 情 绪 值 能 有 效 反映 公众 情绪 受 政 策 干预 影响 的 细微 变化 。 
2. 3. 2. BERTopic 主题 模型 

BERTopic 是 融合 BERT 嵌入 和 TF-IDF 创建 密集 簇 的 新 一 代 主 题 模 型 "， 与 LDA 主题 模型 相 比 ， 它 的 
HAF: C) 基于 谷歌 提出 的 Transformer 架构 双向 编码 表征 预 训练 模型 ， 广 泛 适用 于 各 种 语言 %; (2) 
通过 层次 和 密度 聚 类 ， 使 用 class-based TF-IDF 提取 出 的 每 个 簇 主 题词 语义 更 为 丰富 ， 主 题 特征 更 为 明 
显 。 本 文 首先 使 用 BERTopic 模型 分 析 2. 1 节 获 取 的 31 万 条 微 博 用 户 评论 文本 ， 根 据 聚 类 的 语义 簇 频次 ， 
识别 每 个 阶段 用 户 关 心 的 疫情 热点 主题 ， 尤 其 是 跨 阶段 时 点 的 主题 变化 ， 其 次 ， 将 识别 的 主题 与 时 间断 点 
回归 结合 ， 推 断 新 冠 防疫 政策 干预 引致 用 户 情感 变动 背后 的 认 知 原因 。 


3 分 析 与 讨论 

本 节 首先 给 出 分 阶段 的 多 元 回归 分 析 结 果 ， 识 别 三 个 阶段 显著 影响 日 均 公 众 情绪 值 的 外 生 因素 ， 其 次 ， 
应 用 时 间断 点 回归 分 析 一 、 二 和 二 、 三 阶段 切换 处 的 断 点 处 理 效应 ， 推 断 疫 情 过 制 政策 的 实施 对 微 博 用 户 
情绪 的 因果 影响 ， 最 后 ， 基 于 对 用 户 评论 的 BERTopic 主题 建 模 ， 识 别 微 博 用 户 的 热 议 主题 及 其 对 不 同 阶 
段 用 户 情绪 的 影响 ， 构 建 疫情 过 制 8 项 政策 组 合 一 用 户 热 议 主题 ~ 用 户 情绪 变化 的 因果 链 。 
3.1 多 元 回归 分 析 

为 分 析 三 个 阶段 (爆发 与 封 控 、 过 制 与 恢复 、 常 态 化 防 控 ) 公众 情绪 的 变动 情况 ， 绘 制 三 个 阶段 的 和 
博 用 户 情绪 变动 分 布 箱 线 图 如 图 3 所 示 : 
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三 个 阶段 的 微 博 用 户 情绪 变动 分 布 
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爆发 与 封 控 遏制 与 恢复 常态 化 防 控 
阶段 


图 3 三 个 阶段 的 微 博 用 户 情绪 变动 分 布线 图 


图 3 可 看 到 ， 从 第 一 阶段 到 第 二 阶段 ， 微 博 用 户 日 均 情 绪 分 值 总 体 有 所 下 移 ， 从 第 二 阶段 到 第 三 阶段 ， 


微 博 用 户 日 均 情绪 分 值 总 体 明显 上 升 ， 反 映 新 冠 疫 情 遏 制 政策 确实 对 社会 公众 情绪 造成 了 波动 影响 。 


以 微 博 用 户 日 均 情绪 值 ASW) DWAES, 


变量 、5 个 宏观 经 济 影响 变量 以 及 滞后 的 微 博 用 户 日 均 情 绪 值 变量 〈DDAPS) 等 四 类 24 个 因素 变量 作为 EE 


政府 实施 的 8 项 疫情 遏制 政策 变量 、3 个 疫情 变化 影响 


f=] 


变量 ， 使 用 多 元 回归 模型 分 析 三 个 阶段 微 博 用 户 日 均 情绪 分 值 与 遏制 政策 及 其 他 因素 之 间 的 关系 ， 如 表 2 


所 示 : 

表 2 三 个 阶段 的 微 博 用 户 日 均 情绪 分 值 与 遏制 政策 及 其 他 因素 关系 的 多 元 回归 分 析 
自 变 量 爆发 与 封 控 阶 段 遏制 与 恢复 阶段 常态 化 防 控 阶段 
days -0. 002*** (0. 0004) 0. 004x# (0. 001) 

senti_lag 

senti_lag? 0. 192* (0. 097) 

senti_lag3 

senti_lag4 -0. 231% (0. 120) -0. 274% (0. 094) 

senti lag5 0. 154% (0. 088) 


EI Income. support 
Hl Public. information. campaigns 0. 37 72 


H2 Testing. policy 


0. 020 (0. 010) 
(0. 121) 
0. O51 (0. 011) 


H3 Contact. tracing -0. 838#x# (0. 220) 


H6 Facial. Coverings 0. 41 92% 


TE: 仅 列 示 对 因 变 量 〈 日 均 公 众 情绪 值 ) 有 显著 影响 的 因 


ZR ps0. 01。days 代表 距离 期 初 的 天 数 ，senti lag2、sen 
El 代表 居民 收入 纾 困 政 策 ，H 代表 政府 定期 疫情 发 布 会 ， 


(0. 095) 


素 ， 插 号 中 数字 为 标准 差 ，* 表 示 p<0. 1, FEAR p<0. 05，:#x## 表 
ti_lag4 和 senti_lag5 分 别 代表 滞后 两 天 、 四 天 和 五 天 的 情绪 值 ， 
H2 代表 核酸 检测 ，H3 代表 密 接 者 追踪 政策 ，H6 代表 戴 口 蛙 政策 。 


表 2 结果 显示 : 在 疫情 爆发 与 封 控 阶段 (2020. 1. 1-2020. 2. 20)， 政 府 定 期 的 疫情 发 布 会 和 戴 口 罩 政 
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策 对 公众 情绪 具有 显著 的 正 向 影响 ， 但 密 接 者 追踪 政策 对 公众 情绪 有 显著 的 负面 影响 。 步 入 完全 遇 制 与 初 
步 恢 复 阶段 (2020. 2. 21-2020. 4. 28)， 核 酸 检测 政策 对 公众 情绪 有 显著 的 正 向 影响 。 此 外 ， 居 民 收 入 纾 困 
政策 也 对 公众 情绪 产生 显著 的 正 向 影响 。 不 过 ， 在 该 阶段 ， 疫 情 持 续 天 数 也 对 公众 情绪 有 着 明显 的 负 向 影 
响 。 进 入 全 面 恢复 与 常态 化 防 控 阶段 (2020. 4. 29-2020. 12. 31)， 显 著 影 响 公 众 情绪 的 因素 只 有 疫情 持续 
的 时 长 ， 与 第 二 阶段 不 同 的 是 ， 该 种 影响 由 负 趋 正 ， 反 映 随 着 新 冠 疫情 的 延续 以 及 疫情 防 控 的 常态 化 推进 ， 
社会 公众 看 待 新 冠 疫情 日 趋 客观 理性 ， 对 疫情 的 负面 情绪 逐渐 降低 。 

多 元 回归 分 析 的 结果 仅 能 说 明 不 同 阶段 影响 公众 情绪 的 相关 因素 ， 下 面 进一步 采用 时 间断 点 回归 分 析 
探究 防疫 遏制 政策 对 公众 情绪 的 因果 影响 。 
3.2 时 间断 点 回归 分 析 

参考 高 欣 等 (2022) ”的 建议 ， 按 照 断 点 适用 性 检验 、 断 点 处 理 效应 判定 和 结论 稳健 性 检验 的 步 又 ， 
分 别 对 第 一 和 第 二 阶段 切换 时 点 执行 第 一 次 断 点 回归 ; 第 二 和 第 三 阶段 切换 时 点 执行 第 二 次 断 点 回归 ， 结 
果 如 下 : 

(1) 第 一 和 第 二 阶段 切换 时 点 的 断 点 回归 分 析 

首先 绘制 2020 年 1 月 1 日 至 2020 年 4 月 28 日 (包含 第 一 阶段 和 第 二 阶段 ) 微 博 用 户 日 均 情 绪 值 数 
据 散 点 图 ， 如 图 4 示意 ， 观 察 阶段 切换 时 点 是 否 存在 情绪 值 跳 跃 断 点 。 


a 


第 一 、 二 阶段 断 点 分 析 变 量 分 布 散 点 图 
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图 4 第 一 阶段 和 第 二 阶段 断 点 分 析 变 量 分 布 散 点 图 
可 以 看 到 ，2 月 20 日 右 侧 的 公众 情绪 值 相 较 左 侧 值 出 现 了 一 次 明显 下 移 ， 说 明 该 时 点 的 公众 情绪 值 


存在 明显 的 向 下 跳跃 。 为 进一步 检验 断 点 的 存在 ， 对 2020 年 1 月 1 日 至 2020 年 4 月 28 日 期 间 的 日 均 公 
众 情绪 值 分 别 进行 线性 、2 次 项 、3 次 项 和 4 次 项 拟 合 ， 绘 制 如 图 5 所 示 的 拟 合 图 : 
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A: 第 一 次 断 点 分 析 线性 拟 合 


MELT Basie 过 制 与 恢复 


B: 第 一 次 断 点 分 析 2 次 项 拟 合 


MELT wasn 过 制 与 恢复 
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日 其 
C: 第 一 次 断 点 分 析 3 次 项 拟 合 


MELT mxs tsisa 


08- 4 
2020-01-01 2020-02-01 
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微 博 用 户 日 均 情绪 分 什 
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日 其 
D: 第 一 次 断 点 分 析 4 次 项 拟 合 


MELT waste msm 


t 0.8 
2020-05 2020-01-01 2020-02-01 


= 
© 


微 博 用 户 日 均 情绪 分 值 
to 


2020-05 


2020-03-01 


; 0.8 
2020-05 2020-01-01 2020-02-01 2020-04-01 


图 5 第 一 阶段 和 第 二 阶段 模拟 断 点 回归 分 析 


不 难 发 现 : 4 次 不 同 拟 合 的 结果 均 显 示 公众 情绪 值 存在 一 个 明显 的 向 下 跳跃 ， 因 此 判定 2020 年 1 月 1 
日 至 2020 年 4 月 28 日 期 间 存在 断 点 效应 ， 断 点 处 实施 的 政策 对 社会 大 众 情绪 变化 存在 断 点 影响 。 


接 下 来 估计 断 点 处 的 政策 处 理 效应 ， 为 


人保 估计 结果 的 稳健 性 ， 分 别 采用 局 部 回归 和 全 局 回归 。 在 进 


行 局 部 回归 和 全 局 回归 之 前 ， 首 先 用 rdbwselect 函数 进行 带宽 选择 ， 计 算 结 果 如 表 3 所 示 : 
表 3 第 一 和 第 二 阶段 断 点 处 带宽 选择 
BW est. (h) BW bias (b) 
带宽 值 计算 方法 
Left of c Right of c Left of c Right of c 

mserd 13. 853 13. 853 21. 326 21. 326 
msetwo 12. 006 20. 265 19. 147 30. 897 
msesum 11. 361 11. 361 19. 231 19. 231 
msecomb1 11. 361 11. 361 19. 231 19. 231 
msecomb2 12. 006 13. 853 19. 231 21. 326 
cerrd 10. 988 10. 988 21. 326 21. 326 
certwo 9. 523 16. 074 19. 147 30. 897 
cersum 9.011 9. 011 19. 231 19. 231 
cercomb1 9. 011 9. O11 19. 231 19. 231 


cercomb2 


表 3 中 BW est. 


mse 和 cer 是 带宽 计算 中 常 月 


误 率 ， 适 合用 于 区 间 估计 


9. 523 


(nh) 代表 左右 的 最 佳 带宽 ，BW bias (b) 代表 
的 两 个 方法 ，mse EID RZ, WHI 


的 带宽 选择 ， 因 此 本 研究 适合 于 采 


10. 988 


19. 231 21. 326 
用 于 估计 偏差 矫正 估计 量 的 偏差 带宽 ， 


| mse 均 方 误差 法 。m 


PJ, cer 是 履 盖 错 


点 估计 的 一 个 带 
serd 代表 左右 相等 的 带 


宽 估 计 值 ，msetwo 表示 左右 不 相等 的 带宽 估计 值 ，msesum 代表 回归 估计 值 之 和 的 带宽 选择 ，msecombl 是 
mserd 结尾 的 和 msesum 结尾 的 两 个 带宽 之 间 的 最 小 值 ，msecomb2 是 mserd、msesum、msetwo 三 个 的 中 位 
数 选择 ， 由 表 3 可 得 ， 第 一 和 第 二 阶段 断 点 处 左 侧 的 最 佳 带宽 范围 在 11. 361-13. 853， 右 侧 的 最 佳 带 宽 范 
FÆ 11. 361-20. 265. 
接 下 来 借助 msetwo 方法 对 数据 进行 局 部 线性 回归 和 局 部 多 项 式 回 归 ， 该 方法 会 根据 数据 特点 进行 
动 的 带宽 选择 ， 结 果 如 表 4 所 示 : 
表 4 第 一 和 第 二 阶段 断 点 处 的 局 部 线性 回归 和 局 部 多 项 式 回归 结果 
HEAS 线性 回归 二 次 项 回归 三 次 项 回归 四 次 项 回归 
第 一 阶段 ”第 二 阶段 ”第 一 阶段 ”第 二 阶段 ”第 一 阶段 ”第 二 阶段 ”第 一 阶段 ”第 二 阶段 
对 象 数量 35 68 35 68 35 68 35 68 
BW 估计 值 (h) 12.006 20.265 12.717 22.089 14.042 26. 46 13.91 35. 339 
BW 误差 (b) 19.147 30.897 17.783 29.128 19.766 31.242 18.237 38.386 
曲线 饱满 值 0. 627 0. 656 0. 715 0. 758 0.71 0. 847 0. 763 0.921 
回归 系数 -0.1 -0. 088 -0. 042 0. 045 
回归 误差 0. 028 0. 044 0. 064 0. 098 
p 值 0 0. 046 0. 51 0. 649 
表 4 可 以 看 到 ， 局 部 线性 回归 和 二 次 项 回归 结果 在 95% 置 信 区 间 统 计 显著 ， 局 部 线性 回归 和 2 次 项 回 
归结 果 优 于 3 次 项 和 4 次 项 回归 结果 。 因 此 ， 局 部 回归 确定 的 断 点 处 理 效应 显示 ， 第 一 阶段 实施 的 新 冠 疫 


情 遏 制 政策 在 断 点 处 造成 神 


}: 会 公众 情绪 值 下 降 了 0. 09-0. 1 个 单位 。 
多 


其 次 ， 对 数据 进行 全 局 多 项 式 回 归 ， 结 果 如 表 5 所 示 : 
表 5 第 一 阶段 和 第 二 阶段 断 点 处 的 全 局 多 项 式 回归 结果 
模型 参数 模型 1 模型 2 模型 3 模型 4 模型 5 模型 6 
ae -0.0004%* 0. 002 -0.002x**  -0. O02  —0. 002x -0.002x** 
= (0. 0002) (0. 0005) (0. 0003) (0. 001) (0. 0004) (0. 001) 
T Garein del?) 0. 00002*** 0. 00001 0.00002" 0. 00004 
= (0.00000) (0.00002) (0.00001) (0. 00003) 
0. 000 0. 00000 
ee Ae (0. 00000) (0. 00000) 
-0. 116% -0.092xx*  -0. 080%  -0. 077  -0. 080K  -0. 07328 
treatment 
(0. 012) (0. 012) (0. 013) (0. 016) (0. 014) (0. 017) 
margin _del:treatmen 0. 00224 
t (0. 001) 
I 0. 00001 
(margin del2) : treat (0. 00003) 


ment 
I 


(margin del3) : treat oe 
ment 
ee 1.004% 0.971**¥* 0. 974k 0.973*x* 0.974 0. 969k 
(0. 006) (0. 010) (0. 008) (0. 009) (0. 008) (0. 011) 
Observations 103 103 103 103 103 103 
R2 0. 815 0. 841 0. 851 0. 852 0. 851 0. 852 
Adjusted R2 0. 812 0. 836 0. 847 0. 846 0. 845 0. 844 
vere ee 0. 032 (df=1 0.03(df=9 0.029(df=9 0.029(df=9 0.029(df=9 0. 029(df=9 
00) 9) 9) 8) 8) 7) 


YE: * 表 示 p<0. 1， 六 表示 p<0. 05，*** 表 示 p<0. 01 
表 5 中 treatment 代表 处 理 变 量 ，margin_del 代表 驱动 变量 x 与 断 点 的 差 值 ，margin_de12 代表 驱动 


变量 x 与 断 点 差 值 的 平方 ，margin_de13 代表 驱动 变量 x 与 断 点 差 值 的 三 次 方 ，6 个 全 局 多 项 式 回归 模型 
所 代表 的 含义 如 表 6 PR: 


表 6 全 局 多 项 式 回 归 模 型 含义 


模型 含义 

模型 1 线性 回归 
模型 2 线性 回归 + 交互 项 
模型 3 一 次 项 回归 
模型 4 二 次 项 回归 + 交互 项 
模型 5 三 次 项 回归 
模型 6 三 次 项 回归 + 交互 项 


表 5 分 析 结 果 表 明 : 全 局 多 项 式 回 归 6 种 模型 的 拟 合 优 度 值 较 高 ， 得 到 的 断 点 处 理 效应 统计 显著 ， 效 

应 值 在 [0.07，0. 12] 区 间 波 动 。 
为 在 第 一 和 第 二 阶段 全 局 回归 的 6 个 模型 中 选 出 最 优 的 模型 ， 分 别 计 算 6 个 模型 的 AIC 值 如 表 7 所 示 : 
表 7 第 一 和 第 二 阶段 全 局 多 项 式 回 归 6 个 模型 AIC 值 


模型 AIC 
模型 1〈 线 性 回归 ) -411. 7822 
模型 2( 线 性 回归 + 交互 项 ) -424. 9688 
模型 3 (二 次 项 回归 ) -432. 2533 
模型 4( 二 次 项 + 交互 项 ) -430. 3609 
模型 5 (三 次 项 回归 ) -430. 2536 
模型 6〈 三 次 项 + 交互 项 ) -428. 6955 


AIC 值 越 小 反映 模型 越 优 ， 由 表 7 可 以 看 出 模型 3 〈 二 次 项 回归 ) 的 AIC 值 最 小 ， 因 此 将 模型 3 (二 
次 项 回归 ) 的 结果 作为 第 一 和 第 二 阶段 全 局 多 项 式 回归 结果 。 

最 后 ， 实 施 稳健 性 检验 ， 证 实 研究 指向 的 第 一 和 第 二 阶段 数据 只 有 一 个 断 点 ， 不 存在 其 他 时 刻 的 断 点 。 
为 此 执行 安慰 剂 检验 ， 不 同 断 点 选择 的 P 值 、 回 归 系 数 和 95% 置 信 区 间 如 图 6 所 示 : 
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图 5-A 不 同 断 点 的 P 值 


图 6 第 一 阶段 
图 6-A 假设 存在 四 个 其 他 位 置 的 断 点 ， 
说 明 在 这 些 时 点 处 不 存在 断 点 处 理 效 应 ， 鹿 


图 5-B 不 同 断 点 的 回归 系数 和 95% 的 置信 区 间 


和 第 二 阶段 不 同 断 点 的 安慰 剂 检 验 
但 四 个 安奈 剂 断 点 ( 伪 断 点 ) 回归 系数 对 应 P 值 均 大 于 0. 05, 
FE 实 第 一 和 第 二 阶段 切换 的 2 月 20 日 断 点 效应 真实 存在 且 唯 一 。 


综 上 分 析 ， 局 部 回归 和 全 局 回归 结果 显示 : 在 第 一 和 第 二 阶段 的 切换 时 点 (2 月 20 日 )， 第 一 阶段 实 
施 的 新 冠 疫情 遏制 政策 确实 造成 了 微 博 用 户 公众 情绪 值 的 显著 下 降 ， 下 降 范围 在 0. 07-0. 12 个 单位 。 


(2) 第 二 和 第 三 阶段 切换 时 点 的 断 点 


回归 分 析 


先 绘制 2020 Ẹ 2 H 22 日 至 2020 年 12 月 31 日 《包含 第 二 阶段 和 第 三 阶段 ) 的 日 均 情 绪 值 数据 散 点 


图 (图 7)， 观 察 断 点 是 否 存 在 : 


第 二 、 


三 阶段 断 点 分 析 变 量 分 布 散 点 图 


阶段 。 遏制 与 恢复 o 常态 化 防 控 
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图 7 第 二 阶段 和 第 三 阶段 断 点 分 析 变 量 分 布 散 点 图 
从 图 7 可 知 ， 第 三 阶段 数据 点 《〈 桔 红色 ) 相对 第 二 阶段 数据 点 〈 天 蓝 色 ) 在 2020 E 4H 28 日 前 后 有 
明显 上 移 倾向 ， 说 明 第 三 阶段 的 微 博 用 户 公众 情绪 相对 第 二 阶段 有 所 回升 ， 同 时 ， 两 阶段 切换 处 的 断 点 效 


应 较为 明显 。 
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为 检验 断 点 的 存在 ， 对 2020 4 


合 ， 绘 


2 次 项 、3 次 项 和 4 次 项 拟 


A: 第 一 次 断 点 分 析 线 性 拟 合 
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C: 第 一 次 断 点 分 析 3 次 项 拟 合 


MEE ese satme 
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日 期 
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月 22 日 至 2020 年 12 月 31 
HUA 8 所 示 的 拟 合 图 : 
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B: 第 一 次 断 点 分 析 2 次 项 拟 合 
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D: 第 一 次 断 点 分 析 4 次 项 拟 合 
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图 8 第 二 阶段 和 第 三 阶段 模拟 断 点 回归 分 析 


图 8 可 以 看 到 ， 对 第 
128 日 前 后 有 较为 明显 的 跃升 ， 因 
在 断 点 影响 。 接 下 来 估计 


情绪 值 分 别 ; 


断 点 的 政策 处 理 效应 ， 分 别 采 用 局 部 多 项 式 


| 


2020-10-28 


2020-10-28 


和 第 三 阶段 每 日 公众 情绪 值 的 4 次 不 同 拟 合 结果 表明 ， 公 众 情绪 值 在 2020 年 
此 ， 该 处 存在 断 点 效应 ， 断 点 处 实 
可 归 和 全 局 多 项 式 


施 的 政策 对 微 博 用 户 情绪 变化 存 
归 以 确保 估计 结 


果 的 稳健 性 。 在 进行 可 归 和 全 局 回归 之 前 ， 首 先 用 rdbwselect 函数 进行 带宽 选择 ， 计 算 结果 如 表 8 
所 示 : 
表 8 第 二 和 阶段 断 点 处 带宽 选择 
. BW bias (b) 
带宽 值 计算 方法 
Left of c Right of c Left of c Right of c 
mserd 18. 894 18. 894 28. 270 28. 270 
msetwo 13. 066 56. 509 23. 647 88. 740 
msesum 15. 462 15. 462 25. 596 25. 596 
msecombl 15. 462 15. 462 25. 596 25. 596 
msecomb2 15. 462 18. 894 25. 596 28. 270 
cerrd 14. 187 14. 187 28. 270 28. 270 


行 线性 


certwo 9. 811 42. 431 23. 647 88. 740 
cersum 11. 610 11. 610 25. 596 25. 596 
cercombl 11. 610 11. 610 25. 596 25. 596 
cercomb2 11. 610 14. 187 25. 596 28. 270 
表 8 中 各 参数 的 含义 同 表 3, HR 8 可 得 ， 第 一 和 第 二 阶段 断 点 处 左 侧 的 最 佳 带宽 范围 在 13. 066- 


18. 894， 右 侧 的 最 佳 带宽 范 


接 下 来 借助 msetwo 方法 对 数据 进行 局 部 线性 下 


HÆ 15. 462- 56.509. 


习 ， 该 方法 会 根据 数据 特点 进行 


归 和 局 部 多 项 式 


u 
i 


动 的 带宽 选择 ， 结 果 如 表 9 所 示 : 
表 9 第 二 和 第 三 阶段 断 点 处 的 局 部 线性 回归 和 局 部 多 项 式 回归 结果 
E 线性 回归 二 次 项 回归 三 次 项 回归 四 次 项 回归 
第 二 阶段 ”第 三 阶段 ”第 二 阶段 ”第 三 阶段 ”第 二 阶段 ”第 三 阶段 ”第 二 阶段 ”第 三 阶段 
对 象 数量 68 240 68 240 68 240 68 240 
BW 估计 值 (h) 13.066 56.509 28.54 45.224 36.547 92.397 30.473 78.190 
BW 误差 (p) 23.647 88.74 38.272 78.709 45.951 131.163 38.214 114.359 
曲线 饱满 值 0. 553 0. 637 0. 746 0. 575 0. 795 0. 704 0. 797 0. 684 
回归 系数 0. 079 0. 055 0. 068 0. 079 
回归 误差 0. 013 0. 015 0. 017 0. 028 
p 值 0 0 0 0. 005 


表 9 可 见 ， 无 论 是 线性 


口 


= 


Fak ET 


三 次 项 和 四 次 项 回归 ， 


局 部 线性 回归 结果 在 95% 置 信 区 间 均 


为 统计 显著 ,说 明 第 二 和 第 三 阶段 切换 点 处 的 断 点 效应 十 分 明显 ， 效 应 值 在 [0. 055, 0. 079] 区 间 波 动 。 


接 下 来 ， 对 数据 应 用 全 局 多 项 式 回 归 分 析 ， 结 果 如 表 10 所 示 : 
表 10 第 二 阶段 和 第 三 阶段 模 全 局 多 项 式 回 归结 果 
可 归 模 型 参数 模型 1 模型 2 模型 3 模型 4 模型 5 模型 6 
margin del 0.002% 0.003%  0.00Le 0.001% 0.001#xkx 0. 001% 
(0. 0002) (0. 0002) (0. 0002) (0. 0004) (0. 0002) (0. 0004) 
I (margin del2) = 0. 00004* 0. 00001%* 0. 00001x 0. 00001%** 0. 00002%« 
0. 0000 1** * * * * * 
* (0. 00001) (0.00000) (0.00000 (0.00000) (0. 00001) 
(0. 00000) ) 
I (margin del3) = 
0.00000** 0. 00000 0.00000%* 0. 00000%#* 
* (0. 00000 * * 
(0. 000) ) (0.00000) (0. 00000) 
I (margin del4) 0. 000% -0. 000 
(0. 000) (0. 000) 
treatment -0. 020 -0. 024 0. 042% 0. 036 0. 031% -0. 046% 
(0. 019) (0. 017) (0. 018) (0. 022) (0. 018) (0. 022) 


margin del2:treatment 


0. 000 Ls 


(0. 00001) 


I 0. 00000 -0. 00000 
(margin del3) : treatmen (0. 00000 (0. 00000) 
t ) 
I 0. 000 
(margin del4) :treatmen (0. 000) 
t 
Constant 0. 945*** 0. 9042 0. 879*** 0. 88 Le 0. 87828 0. 867*** 
(0. 011) (0. 011) (0. 012) (0. 013) (0. 012) (0. 014) 
Observations 308 308 308 308 308 308 
R2 0. 536 0. 627 0. 651 0. 651 0. 655 0. 657 
Adjusted R2 0. 531 0. 622 0. 646 0. 645 0. 659 0. 65 
Residual Std. Error 0. 065 0. 058 0. 056 0. 056 0. 056 0. 056 


(df=304) (df=303) (df=303) (df=302) (df=302) (df=301) 


表 10 中 各 参数 的 含义 同 表 5， 为 在 第 二 和 第 三 阶段 全 局 回归 的 6 个 模型 中 选 出 最 优 的 模型 ， 分 别 计 


算 6 个 模型 的 ATC 值 如 表 11 所 示 : 
表 11 第 二 和 第 三 阶段 全 局 多 项 式 回 归 6 个 模型 AIC 值 


模型 AIC 
模型 1 〈 线 性 回归 ) -411. 7822 
模型 2〈 线 性 回归 + 交互 项 ) -424. 9688 
模型 3〈 二 次 项 回归 ) -808. 2638 
模型 4〈 二 次 项 + 交互 项 ) -873. 2461 
模型 5〈 三 次 项 回归 ) -894. 0158 
模型 6〈 三 次 项 + 交互 项 ) -892. 235 


AIC 值 越 小 反映 模型 越 优 ， 由 表 11 可 以 看 出 模型 5〈 三 次 项 回归 ) 的 AIC 值 最 小 ， 因 此 将 模型 5 三 
次 项 回归 ) 的 结果 作为 第 二 和 第 三 阶段 全 局 多 项 式 回归 结果 。 

最 后 ， 实 施 稳健 性 检验 ， 核 查 第 二 和 第 三 阶段 数据 期 间 的 断 点 是 否 唯一 ， 不 存在 其 他 位 置 的 断 点 。 为 
此 执行 安奈 剂 检 验 ， 不 同 断 点 选择 的 P 值 、 回 归 系 数 和 95% 置 信 区 间 如 图 9 所 示 : 
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图 8-A 不 同 断 点 的 P 值 图 8-B 不 同 断 点 的 回归 系数 和 95% 的 置信 区 间 


图 9 第 二 阶段 和 第 三 阶段 不 同 断 点 的 安慰 剂 检验 
图 9-A 假设 存在 四 个 其 他 位 置 的 断 点 ， 不 难 发 现 ， 四 个 安慰 剂 断 点 ( 伪 断 点 ) 的 回归 系数 中 ， 三 个 的 
P 值 明显 大 于 0.05， 在 这 些 点 处 不 存在 处 理 效应 ， 第 四 个 断 点 的 回归 系数 值 尽管 小 于 0.05， 但 效果 不 
如 选 定 的 断 点 ， 这 也 再 次 表明 所 选 断 点 真实 存在 ， 且 效应 显著 。 

综 上 分 析 ， 局 部 回归 和 全 局 回归 结果 表明 : 在 第 二 和 第 三 阶段 的 切换 时 点 (4 月 28 日 )， 第 二 阶段 实 
施 的 新 冠 疫情 遏制 政策 确实 造成 了 微 博 用 户 公众 情 绪 值 的 显著 回升 ， 回 升 范围 在 0. 06-0. 08 个 单位 。 
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3.3 BERTopic 主题 建 模 分 析 


上 一 节 通 过 时 间断 点 回归 证 实在 第 一 和 第 二 阶段 实施 的 不 同 新 冠 疫情 过 制 政策 分 别 对 2 月 20 日 微 博 
用 户 情绪 的 下 降 以 及 4 月 28 日 微 博 用 户 情绪 的 回升 具有 显著 的 因果 影响 。 但 这 些 分 析 无 法 进一步 揭示 影 
响 用 户 情绪 波动 的 评论 热点 内 容 。 本 节 进 一 步 使 用 BERTopic 主题 建 模 ， 从 2. 1 节 获 取 的 31 万 条 微 博 用 户 
评论 文本 中 识别 出 十 五 个 热点 主题 〈 表 12)， 进 而 对 识别 的 热点 主题 进行 断 点 回归 分 析 (图 10- 图 13), 
探索 各 主题 在 跨 阶段 时 点 的 变化 情况 ， 从 而 构建 新 冠 防 疫 歇 制 政策 实施 一 用 户 评 论 热点 主题 一 用 户 情绪 变 


动 的 因果 逻辑 链 ， 揭 示 政 策 影响 微 博 用 户 情绪 的 深层 原因 。 
表 12 BERTopic 主题 建 模 识别 的 十 五 个 热点 主题 


| 


序号 主题 语义 出 现 频率 累计 频率 
1 Topic2 武汉 加 油 点 赞 1. 17% 1. 17% 
2 Topic5 各 地 新 增 确诊 0. 61% 1. 78% 
3 Topicl2 北京 疫情 信息 0. 43% 2. 21% 
4 Topic18 学 校 停课 封 控 0. 34% 2. 55% 
5 Topic20 热 议 病毒 来 源 0. 34% 2. 89% 
6 Topicl9 庆祝 医护 凯旋 0. 34% 3. 23% 
7 Topic23 热 议 封 控 代价 0. 32% 3. 55% 
8 Topic27 交通 停 运 管控 0. 30% 3. 85% 
9 Topic33 致敬 白衣 战士 0. 28% 4. 13% 
10 Topic38 疫情 形势 好 转 0. 26% 4. 39% 
11 Topic41 PAR BBE 0. 24% 4. 63% 
12 Topic45 点 赞 中 国 抗 疫 0. 23% 4. 86% 
13 Topic46 严防 境外 输入 0. 23% 5. 09% 
14 opic56 中 医治 疗 方案 0. 20% 5. 30% 
15 opic64 新 增 感 染 清 零 0. 19% 5. 49% 


注 : 加 粗 主题 的 语义 与 疫情 坎 制 政策 的 实施 有 关 
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A Topic 2 ( 武汉 加 油 点 赞 ) 断 点 回归 分 析 B Topic5( 各 地 新 增 确诊 ) 断 点 回归 分 析 
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日 期 
图 10 Topic2、5、12、18 断 点 回归 分 析 结 果 
依照 3. 2 节 时 间断 点 回归 分 析 步 又 ， 对 BerTopic 识别 的 前 四 大 热点 主题 在 三 个 阶段 的 切换 点 实施 断 


点 回归 分 析 ， 结 果 如 图 10 所 示 ， 图 中 横 轴 为 时 间 ， 纵 轴 为 主题 频次 的 自然 对 数 ， 可 以 表征 主题 随时 间 的 
变化 ，D 为 断 点 效应 值 ，P 为 断 点 处 理 效 应 的 统计 显著 性 。 从 图 10-A/B/C 可 以 看 到 : Topic? (为 武汉 加 
W), Topic 5《〈 各 地 新 增 确 诊 ) 和 Topic 12〔 北 京 疫情 信息 〉 尽管 是 微 博 用 户 高 度 关 注 的 TOP3 热 评 主题 ， 
但 在 一 、 二 阶段 和 二 、 三 阶段 切换 处 断 点 效应 不 显著 〈P>0.05)， 说 明 这 三 类 主题 不 是 引致 微 博 用 户 情感 
波动 的 主要 原因 。 

Topic 18〔 学 校 停课 封 控 ) 是 微 博 用 户 热 评 的 第 四 大 主题 ， 图 10-D 可 见 ，Topic 18 在 第 二 阶段 Ga 
制 与 恢复 ) 与 第 三 阶段 (常态 化 防 控 ) 切换 时 刻 存在 显著 的 断 点 效应 (p=0. 0067<0. 01, D=-0. 4491)， 反 
映 微 博 用 户 对 学 校 停课 封 控 的 讨论 频次 在 二 、 三 阶段 的 切换 点 有 显著 下 降 。 结 合 公众 情绪 值 从 第 二 阶段 转 
向 第 三 阶段 处 存在 显著 向 上 的 事实 ， 可 以 认为 学 校 复 课 是 导致 二 、 三 阶段 断 点 处 公众 情绪 回升 的 主要 原因 。 
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E Topic 20 ( 热 议 病毒 来 源 ) 断 点 回归 分 析 F Topic 19 (庆祝 医护 凯旋 ) 断 点 回归 分 析 
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= TEES sielai Le 一 过 制 与 恢复 B | 一 常态 化 防 控 
放大 | 
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2020-01-01 2020-02-01 2020-03-01 2020-04-01 2020-05-01 2020-05-01 2020-08-01 2020-11-01 
日 期 日 期 
G Topic 23 ( 热 议 封 控 代价 ) 断 点 回归 分 析 H Topic 27 ( 交通 停 运 管控 ) 断 点 回归 分 析 
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日 其 日 期 
11 Topic20、19、23、27 断 点 回归 分 析 结 果 
进一步 对 微 博 用 户 热 评 的 TOP5-TOP8 主题 实施 断 点 回归 分 析 ， 结 果 如 图 11-E/F/G6/H。 第 七 大 主题 
Topic23 〈 热 议 封 控 代价 ) 和 第 八大 主题 Topic27 (交通 停 运 管控 ) 都 与 政府 实施 的 疫情 遏制 政策 密切 相 


关 。 前 者 集中 反映 公众 对 疫情 封 控 付出 代价 的 评议 ， 后 者 


11-H 显示 : Topic27 (交通 停 运 管控 ) 在 一 、 


阶段 和 二 、 


聚焦 公众 对 政府 实施 交通 
三 阶段 切换 处 断 点 效应 不 显著 〈P>0.05)， 说 


明 这 类 主题 不 是 引致 阶段 切换 点 微 博 用 户 情感 波动 的 主要 原因 。 图 


在 第 一 阶段 (爆发 与 封 控 ) 与 第 二 阶段 OR 


D=0. 4876)， 说 明 微 博 用 户 对 封 控 代价 的 讨论 频次 在 一 
第 一 阶段 向 第 二 阶段 切换 处 显著 向 下 的 事实 ， 可 以 # 


主要 原因 。 


管控 政策 的 感受 。 图 


Topic20〔 热 议 病毒 来 源 ) 是 微 博 用 户 热 记 
点 存在 显著 的 断 点 效应 (p=0. 0013<0. 01，D=0. 8609)， 微 博 用 户 对 新 冠 病毒 来 源 的 讨论 频次 在 一 
切换 时 点 显著 上 升 。 反 映 微 博 用 户 注 意 力 在 此 期 间 越 来 
第 二 阶段 相 较 第 一 阶段 显著 向 下 的 事实 ， 可 以 # 


绪 下 降 的 主要 原因 。 


Topicl9《〈 庆 祝 医护 凯旋 ) 是 微 博 用 户 热 记 


值 从 第 二 


的 第 五 大 主题 ， 


图 


越 关 注 新 冠 病毒 的 济源 问题 ， 
矣 断 对 病毒 来 源 的 质疑 是 导致 一 、 二 阶段 断 点 处 微 博 用 户 情 


11-G 可 见 ，Topic23( 热 议 封 控 代价 》 


制 与 恢复 ) 切换 时 刻 存 在 显著 的 断 点 效应 (p=0. 0125<0. 05, 
、 二 阶段 切换 点 明显 上 升 。 结 合 微 博 用 户 情绪 值 在 
E 断 严格 封 控 是 导致 一 、 二 阶段 断 点 处 公众 情绪 下 落 的 


11-E 展现 ，Topic20 在 一 、 二 阶段 切换 
、 二 阶段 
结合 微 博 用 户 情 绪 值 


的 第 六 大 主题 ， 从 图 11-F 看 到 ，Topic19 ERNE OR 


制 与 恢复 ) 与 第 三 阶段 〈 常 态 化 防 控 ) 切换 时 刻 存 在 显著 的 断 点 效应 Cp=0. 0338<0. 05, D=0. 5636)， 说 明 
微 博 用 户 在 二 、 三 阶段 切换 点 针对 驰援 武汉 的 医护 人 员 平 安 归 来 的 讨论 频次 明显 上 升 。 
阶段 转向 第 三 阶段 处 显著 上 升 的 事实 ， 可 以 推断 公众 欢送 


结合 微 博 用 户 情绪 
医护 人 员 撤 离 武 汉 是 导致 二 、 三 阶段 断 
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点 处 公众 情绪 回升 的 主要 原因 。 


] Topic 33 ( 致敬 白衣 战士 ) 断 点 回归 分 析 K 


1.2 


Topic 38 (疫情 形势 好 转 ) 断 点 回归 分 析 
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x 下 一 过 制 与 恢复 K 0.6 "mi 一 坎 制 与 恢复 
g a’ P=0.4295 一 常态 化 防 控 E ze 。 。 一 常态 化 防 控 
0.3- 。 
站 i = ~ =0.3536 
` p=0.0382 
0.0 = - Sy cates oo ew ee ne ar 0.0 = eaem i‘ © © cam cece eee o 
2020-05-01 2020-08-01 2020-11-01 2020-05-01 2020-08-01 2020-11-01 
日 期 日 期 
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12 Topic33、38、41、45 断 点 


90040000 


1 1 
2020-08-01 2020-11-01 


2020-05-01 a A 
可 归 分 析 结 果 


接 下 来 对 用 户 热 评 的 TOP9-TOP12 主题 实施 断 点 回归 分 析 ， 结 果 如 图 12。 从 图 12-J/M/N 可 以 看 到 : 
Topic33 (致敬 白衣 战士 )、Topic41 (fila O BPH) 和 Topic45 (点 赞 中 国 抗 疫 ) 在 和 二 、 三 阶段 切换 


处 断 点 效应 不 显著 (P>0. 05)， 说 明 这 三 类 


主题 不 是 引致 微 博 用 户 情感 波动 的 主要 原因 。 
势 好 转 ) 是 微 博 用 户 热 评 的 第 十 大 主题 ， 图 12-K 表明 ，Topic38 在 第 二 阶段 与 第 三 阶段 切换 时 刻 存 在 显 


Topic38 (疫情 形 


4, 


著 的 断 点 效应 (p=0. 0382<0. 05, D=0. 3536)， 微 博 用 户 对 我 国 疫情 形势 总 体 好 转 的 讨论 频次 在 二 、 三 阶段 


切换 点 明显 上 升 。 


绪 回 升 的 主要 原因 。 


结合 公众 情绪 值 从 第 二 阶段 转向 第 三 阶段 显著 向 上 的 事实 ， 可 以 推断 疫情 形势 好 转 是 导 
致 二 、 三 阶段 断 点 处 公众 情 
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P Topic 46 (严防 境外 输入 ) 断 点 回归 分 析 R Topic 56 (中 医治 疗 方案 ) 断 点 回归 分 析 
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S Topic 64 ( 新 增 感染 清 零 ) 断 点 回归 分 析 
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13 Topic46、56、64 断 点 回归 分 析 结 果 
最 后 ， 对 用 户 关注 的 TOP13-TOP15 主题 实施 断 点 回归 分 析 ， 结 果 如 图 13 示意 。 从 图 13-P/R/S 不 难 发 


I: Topic46 〈 严 防 境外 输入 )、Topic56 (PERRI ATS) 和 Topic64 (新 增 感 染 清 零 ) 在 一 、 二 阶段 和 
二 、 三 阶段 切换 处 断 点 效应 不 显著 〈(P>0. 05)， 说 明 这 三 类 主题 不 是 引致 微 博 用 户 情感 波动 的 主要 原因 。 


综合 图 10- 图 13 分 析 结 果 ， 构 建新 冠 防疫 过 制 政策 的 实施 影响 微 博 用 户 情绪 变动 的 因果 链 如 图 14 所 


7R: 


Quanmasneas @) 微 博 用 户 热 议 主题 CO (@) 微 博 用 户 情感 异动 
Topic2 (武汉 加 油 点 赞 ) 
Topic5 (各 地 新 增 确诊 ) 


Topicl2 (北京 疫情 信息 ) 


限制 公共 交通 
C5_Close.public.transport 
(1 月 27 日 -7 月 22 日 ) 


管控 跨 境 人 员 流 动 


C8_International.travel.controls 


(1 月 27 日 开始 ) 


Topic27 (交通 停 运 管控 


Topic33 (致敬 白衣 战士 


Topic41 (MAA EIE 
[Topicas (点 赞 中 国 搞 疫 ) 


Topic46 (严防 境外 输入 


佩戴 口音 Topic56 (中 医治 疗 方案 
H6_Facial.Coverings eee 
(1 月 27 日 开始 ) Topic64 (新 增 感染 清 零 


14 新 冠 防疫 遇 制 政策 对 微 博 用 户 认 知 及 情感 影响 的 因果 链 


综 上 分 析 ， 通 过 对 2020 年 新 浪 微 博 12 个 政府 、 新 闻 媒 体 以 及 知名 博 主 账号 下 31 万 余 条 新 冠 疫情 公 
众 用 户 评论 的 语义 及 情感 因果 推断 分 析 ， 可 以 得 到 以 下 几 点 结论 : 
第 一 ， 新 冠 防疫 遏制 政策 组 合 的 实施 对 新 浪 微 博 用 户 情感 波动 存在 明显 的 断 点 影响 。 这 种 影响 在 
2020 年 2 月 20 日 前 后 ， 造 成 微 博 用 户 公众 情绪 值 显著 下 降 0. 07-0. 12 个 单位 ， 在 2020 年 4 月 28 日 前 后 ， 
也 带 来 微 博 用 户 公众 情绪 值 显著 回升 0.06-0. 08 个 单位 。 新 冠 防疫 遏制 政策 的 实施 引发 网 民 在 微 博 中 的 评 
论 ， 进 而 汇聚 成 热点 议题 ， 这 些 热 议 主题 形 塑 更 多 微 博 用 户 的 认同 ， 进 而 造成 用 户 从 认 知 到 情绪 层面 的 群 
体 联动 效应 。 
第 二 ， 新 冠 防疫 遏制 政策 组 合 对 微 博 用 户 的 认 知 与 情绪 影响 具有 异 质 性 。 单 独 考察 ，8 项 政策 中 仅 有 
4 项 政策 在 实施 中 引发 微 博 用 户 热 议 主题 的 形成 ， 可 能 与 这 些 政策 涉及 每 个 人 且 有 具有 强制 性 有 关 。 这 些 单 
个 政策 中 ， 只 有 校园 封 控 政策 的 实施 引发 微 博 用 户 热点 评议 ， 进 而 对 阶段 2 转向 阶段 3 的 公众 情绪 产生 显 
著 影 响 ， 反 映 单个 政策 的 实施 对 微 博 用 户 的 认 知 与 情感 影响 有 限 。 此 外 ，Topic23: 热 议 封 控 代价 是 造成 
阶段 1 转向 阶段 2 公众 情绪 明显 下 降 的 原因 ， 说 明 防疫 遏制 政策 组 合 实施 给 公众 带 来 的 不 便 受到 微 博 用 户 
的 热 议 ， 且 显著 影响 了 群体 情绪 的 向 下 波动 。 
第 三 ， 追 溯 微 博 用 户 情感 的 波动 ， 既 受 新 冠 防疫 遏制 政策 组 合 实施 的 影响 ， 也 有 公众 自发 的 其 他 热 议 
主题 的 影响 。 例 如 ， 显 著 影 响 2 个 阶段 切换 断 点 处 用 户 情感 变动 的 热 议 主 题 ， 如 Topic20 〈 热 议 病毒 来 源 ) 
和 Topic19《〈 庆 祝 医 护 凯旋 ) 明显 与 政策 实施 无 关 。 这 也 佐证 ， 应 用 时 间断 点 回归 和 BERTOPIC 主题 模型 
算法 ， 通 过 分 析 热 点 主题 联动 引发 的 用 户 情感 变化 ， 能 够 起 到 溯 因 推断 的 效果 。 


=, 


4 结论 与 展望 

新 冠 疫 情 传染 隐秘 、 发 展 不 定 的 特性 为 疫情 的 防 控 带 来 前 所 未 有 的 挑战 ， 有 效 的 疫情 应 对 离 不 开 对 
政策 影响 准 实时 监测 的 手段 支撑 。 本 文 以 情绪 即 社会 信息 理论 为 依托 ， 提 出 融合 BERTopic 主题 模型 与 多 
元 回归 (MLR)、 时 间断 点 回归 CRDIT) 的 防疫 政策 事 中 监测 与 评价 新 方法 ， 对 新 浪 微 博 2020 年 31 万 余 条 
新 冠 疫情 高 频 用 户 评论 分 析 发 现 : 〈1) 新 冠 防疫 遏制 政策 组 合 的 实施 在 2020 年 2 月 20 日 前 后 ， 造 成 微 博 
用 户 公众 情绪 值 显著 下 降 0. 07-0. 12 个 单位 ， 在 2020 年 4 月 28 日 前 后 ， 也 带 来 微 博 用 户 公众 情绪 值 显 著 
回升 0. 06-0. 08 个 单位 ;(2〉 防 疫 政 策 组 合 对 微 博 用 户 的 认 知 与 情绪 影响 具有 异 质 性 ， 涉 及 个 体 、 具 强制 
性 的 政策 易 引 发 网 民 热 议 且 联 动 公众 情绪 显著 下 滑 ; (3) 基于 分 析 构 建 的 政策 干预 用户 热 议 主题 用户 
情感 异动 因果 链 ， 能 够 起 到 溯 因 推断 政策 实施 成 效 的 作用 。 

本 文 的 理论 贡献 在 于 : C) 为 大 数据 驱动 的 公共 卫生 政策 循 证 决策 提供 了 新 思路 。 既 有 研究 指出 : 
大 数据 分 析 驱 动 理论 发 展 的 途径 多 样 ， 包 括 : 大 数据 驱动 的 理论 框架 构建 ， 现 有 理论 的 精细 验证 ， 细 粒度 
的 理论 阐释 与 精准 预测 ， 以 及 揭示 新 现象 的 理论 生成 ”。 本 文 基于 系统 观 构 建 的 新 冠 防疫 政策 对 社交 媒体 
用 户 影响 的 框架 ， 以 及 通过 分 析 社 交 媒 体 用 户 评论 数据 发 现 公 众 疫 情 认 知 热 点 、 推 断 政 策 公 众 情绪 影响 的 
思路 ， 既 是 对 已 有 理论 更 为 细致 的 检验 ， 也 为 宏观 政策 干预 和 微观 用 户 认 知 提供 了 连接 桥梁 ， 有 助 于 理论 
在 不 同 细 粒 度 的 阐述 与 分 析 。(2) 为 基于 文本 数据 的 政策 评价 因果 推断 提供 了 新 例证 。 近 年 来 ， 随 着 因果 


202308.00034v1 


chinaXiv 


EA 


GME 


在 公共 政策 循 证 决策 领域 应 用 ， 潜 在 结果 模型 (Potential Outcomes Model, POM) 将 实验 研究 
究 统 一 在 一 个 框架 下 


思考 ， 促 进 了 统计 学 与 公共 政策 评价 研究 跨 学 科 交 叉 ”。 本 文 研究 应 用 的 时 


间断 点 回归 即 是 一 种 典型 的 潜在 结果 模型 ， 分 析 应 用 表明 ， 该 方法 能 用 于 公共 政策 评价 中 的 政策 干预 影响 


分 析 ， 可 以 较 好 地 


互联 网 月 


昌 户 的 情绪 异动 提供 


回答 政策 评估 中 的 因果 推断 ， 尤 其 是 文本 数据 的 溯 因 推断 问题 ， 为 深入 洞悉 政策 实施 对 


Ek 了 新 的 认 知 视角 和 探究 方法 。 


本 文 的 实践 价值 主要 体现 在 提出 了 一 种 具有 直面 公众 ， 数 据 驱 动 ， 淹 因 推 断 特 点 的 突 发 公共 卫生 事 


件 防疫 政策 事 中 监测 与 评价 
本 文 提出 的 方法 具有 较 强 的 潜在 适用 面 ， 除 了 在 公共 卫生 政策 的 准 实时 监测 上 有 所 例证 外 ， 还 可 用 于 其 人 
吸 需 及 时 获取 公众 政策 回应 的 政策 评价 领域 ， 进 一 步 推动 政策 评价 从 事前 评估 和 事后 评价 向 


施 策 于 民 ， 
中 实时 追 


踪 延 展 。 


论文 也 存在 一 些 不 足 。 


AME 


注释 
© 


© 
© 


3 A Br R tk 


新 方法 ， 为 健全 疫情 多 渠道 监测 预警 ， 落 实 科学 精准 防疫 增添 新 手段 。 此 外 ， 


tS 


Bui 


T 


首先 ， 研 究 主 要 从 中 央 层 面 的 防疫 遏制 政策 入 手 ， 将 全 国 的 疫情 防 控 作为 一 


究 ， 某 种 程度 上 忽略 了 省 级 和 地 域 之 间 的 异 质 性 。 其 次 ， 受 多 方面 因素 制约 ， 研 究 数据 时 间 跨 度 
集中 于 新 冠 疫情 爆发 的 第 一 
策 对 网 民心 理 


年 (2020 年 )， 未 来 可 以 纳入 更 多 更 新 的 数据 ， 考 察 疫情 延续 动荡 下 ， 防 疫 政 


认 知 和 情绪 波动 的 不 同 影响 。 


博 数 据 中 心 ( 2021 ): < th 博 2020 用 户 发 展 报 告 》， 


https://m. weibo. cn/1642909335/4613864249365413。 


选择 2 月 20 日 作为 断 点 的 原因 在 于 在 此 之 后 疫情 得 到 有 效 控制 


选择 4 月 28 日 作为 断 点 的 原因 在 于 在 此 之 后 疫情 防 控 进 入 常态 化 阶段 
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Determining containment policy impacts on public sentiment during the 


pandemic using SINA MicroBlog user comments 


Wu Jun! Zeng Lifan! Fan Haoyue! Yang Yang! 
(1 Beijing University of Posts and Telecommunications, Beijing 100876) 

Abstract: [Purpose/Significance] During the duration of the pandemic, how to timely perceive, effectively 
quantify and continuously track the impact of the government's containment policy combination on public 
cognition and sentiment is an urgent problem to be solved in monitoring and emergency response. 
[Method/Process] Based on the emotion as social information theory, we propose a new method combining the 
BERTopic model with Multiple Linear Regression(MLR) and Regression Discontinuity in Time (RDiT) to carry 
out causal inference on more than 310,000 high-frequency user comments on COVID-19 on SINA MicroBlog in 
2020, in order to reveal the impact of the combination of containment policies on the public sentiment. 
[Results/Conclusion] The findings are as follows: (1) The implementation of the COVID-19 containment policy 
combination around February 20, 2020 caused a significant decrease in the values of sentiment by 0.07-0.12 units, 
and around April 28, 2020, also caused a significant increase in the values of sentiment by 0.06-0.08 units; (2) The 
combination of containment policy has a heterogeneous impact on public sentiment, and policies involving 
individuals and coercive policies are able to arise heated discussions and significantly reduce the values of public 
sentiment; (3) The causal chain of policy intervention — user's hot topic 一 public sentiment constructed based on 
analysis can play a role of retrospective inference of policy implementation effectiveness. This study not only 
opens up new ideas for containment policy evaluation, but also adds new means for public oriented real-time 
pandemic prevention monitoring. 

Key words: containment policy public sentiment Multiple Linear Regression Regression Discontinuity in 


Time BERTopic 


